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深度 学 习 在 大 豆 叶片 图 像 数据 管理 中 的 识别 与 分 类 研究 


fi 2: [目的 / 意义 ] 为 了 提高 大 豆 叶 片 图 像 的 分 类 精度 与 效率 ， 进 一 步 对 大 豆 叶 片 图 像 进行 存储 与 管 


陆 丽 娜 ?22， 于 啸 1 
(1. 山东 理工 大 学 管理 学 院 ， 淄 博 255000; 2. 山东 理工 大 学 计算 机 科学 与 技术 学 院 ， 淄 博 255049) 


。 [方法 / 过 程 ] 本 


文 利用 深度 学 习 方法 ， 针 对 肉眼 观察 准确 率 较 低 且 不 同人 群 分 类 结果 差异 较 大 的 大 豆 叶 片 图 像 数 据 


是 出 了 一 种 自动 分 类 方法 。 


本 研究 首先 对 大 豆 叶 片 进行 ROI 感 兴趣 区 域 划分 ， 进 而 利 


分 水 岭 分 割 方法 对 大 豆 叶 片 进行 提取 ， 最 


后 通过 深度 学 习 高 效 精 


一 


> 类 识别 的 研究 ， 达 到 了 较 高 的 识别 准确 率 。 
关键 词 : 深度 学 习 ; 农业 科学 数据 ; 数据 分 类 ; 图 象 识别 
中 图 分 类 号 : G250.7 


的 实现 了 大 豆 叶 片 的 分 类 识别 。 [结果 / 结论 ] 通 过 分 析 大 豆 叶片 形态 图 像 特 点 后 ， 基 二 


文献 标识 码 : A 文章 编号 : 


深度 学 习 开展 了 对 大 豆 叶片 形态 的 
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虽然 大 量 文献 表明 中 国 农业 数据 的 整理 、 发 布 和 
共享 都 还 处 于 初级 阶段 ， 但 随 着 数据 科学 和 计算 机 技 
术 的 深入 发 展 ， 技 术 在 数据 管理 上 的 应 用 更 加 广泛 和 
深入 。 深 度 学 习 在 文本 数据 识别 和 图 像 数据 识别 与 分 
类 方面 都 起 到 了 重要 作用 ， 替 代 传统 的 机 器 学 习 方法 ， 
在 大 规模 样本 分 析 、 识 别 与 分 类 中 ， 采 用 了 无 监督 学 
习 方 法 ， 本 文 结合 大 豆 的 图 像 数 据 识 别 与 分 类 进行 分 
析 ， 通 过 案例 分 析 ， 站 在 实验 数据 的 图 像 数据 采集 视 


角 ， 总 结 了 大 规模 样本 数据 的 农业 科学 数据 采集 与 分 
类 ， 从 科学 实验 数据 采集 与 分 类 的 应 用 场景 出 发 ， 展 
示 了 深度 学 习 技 术 的 应 用 进展 。 

在 过 去 的 10 年 中 ， 图 像 处 理 和 计算 机 视觉 方 法 已 
广泛 用 于 植物 病害 的 检测 和 分 类 。 在 国内 方面 ， 学 者 
们 已 经 在 植物 表 型 数据 处 理 方面 发 现 了 深度 学 习 的 成 
功 应 用 ， 如 岔 杨 等 的 基于 深度 学 习 的 农业 植物 表 型 研 
究 综 述 上 ， 岑 海燕 等 的 深度 学 习 在 植物 表 型 研究 中 的 应 
用 现状 与 展望 pg; 同时 ， 基 于 卷 积 神经 网 络 的 植物 分 类 
和 品种 识别 也 取得 了 一 些 研 究 成 果 ， 袁 培 森 等 基于 卷 
积 神经 网 络 的 菊花 花 型 和 品种 识别 中， 吴 剑 涛 等 基于 次 
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逐 感 图 像 苹 果树 冠 信 息 提 取 ， 避 免 了 实地 测 
ei en 
国外 方面 ， 已 经 建立 了 很 多 类 似 的 植物 病害 的 检测 的 
数据 集 ， 比 如 柑橘 类 水 果 ， 叶 子 和 茎 的 图 像 数据 集 四 、 
PlantVillage 数据 集 、kaggle 数据 集 等 。 同 时 ， 还 有 很 
多 基于 深度 学 习 植 物 图 像 的 分 类 研究 : MAYRA 等 使 
用 3D-CNN 生成 了 整个 研究 区 域 的 墙 到 墙 树种 地 图 ， 
改进 的 树种 分 类 可 以 有 益 于 可 持续 林业 和 生物 多 样 性 


EPT, MADS 等 以 杂 草 分 类 为 例 ， 利 用 深度 卷 积 神经 
e 


， 深 度 学 习 在 农业 科学 数据 管理 的 应 用 主要 
P A a 
类 ， 农 业 的 病虫害 检测 、 农 作物 及 杂 草 检测 与 分 类 、 
农作物 的 产量 预测 等 研究 中 中 。 粮 食 作物 中 的 病虫害 和 
各 种 疾病 严重 影响 主 产 ， 并 给 全 球 经 济 造成 重大 损失 。 
粮食 作物 健康 的 监测 和 疾病 的 早期 诊断 是 可 持续 农业 
的 关键 任务 ， 现 有 的 谷物 植物 病害 自动 检测 和 分 类 方 
法 仍 处 于 起 步 阶段 。 因 此 ， 新 颖 的 全 自动 工具 对 于 谷 
物 植 物 中 疾病 的 检测 和 分 类 过 程 必 不 可 少 t0。 本 文 以 
大 豆 的 图 像 数 据 的 识别 为 例 ， 探 讨 深度 学 习 方法 是 如 
何在 大 豆 叶 片 图 像 数 据 管理 实践 中 进行 应 用 的 。 


2 基于 深度 学 习 的 农业 科学 图 像 数 据 
识别 与 分 类 
2.1 数据 准备 


大 豆 叶 片 形态 是 大 豆 最 重要 的 形态 特征 和 生物 学 


特征 之 一 。 正 确 地 采集 大 豆 
深度 学 习 分 类 识别 的 准确 率 ， 提 高 
模型 的 泛 化 能 

2.1.1 大 豆 叶片 数据 特点 

大 豆 叶片 形态 以 植株 三 出 复 叶 中 的 顶 小 叶 形 状 为 
准 ,， 分 为 披 针 、 卵 圆 、 椭 圆 和 圆 4 种 形态 ， 如 图 1 所 
示 。 数 据 主要 具有 以 下 特点 。 
(1) 不 同形 态 差 异 小 : 大 豆 
征 差异 较为 明显 的 多 种 植物 叶片 之 间 的 分 类 不 同 ， 不 
同 大 豆 叶片 形态 之 间 差 异 较 小 ， 人 为 区 分 难度 较 高 。 

(2) 同 种 形态 特征 变化 大 : 同一 种 类 型 的 大 豆 叶 
片 之 间 ， 形 态 特 征 变化 较 大 ， 不 具有 典型 性 。 

(3) 叶片 弯曲 不 平整 : 大 豆 叶片 大 多 蜡 缩 不 平整 ， 

影响 人 们 对 叶片 形态 的 判断 。 

基于 大 豆 叶片 数据 的 特点 ， 对 于 大 豆 叶片 图 像 数 
据 的 分 类 识别 ， 主 要 面临 以 下 困难 。 

(1) 数据 图 像 易 失真 ， 目 前， 针对 不 同 植物 叶片 
的 分 类 ， 大 多 是 利用 网 上 直接 下 载 的 数据 集 ， 虽 然 方 
便 易 用 ， 但 可 能 由 于 拍摄 不 能 完全 地 垂直 于 叶片 ， 导 
致 大 豆 叶片 形态 产生 非 线 性 失真 等 问题 

(2) 目标 容易 被 迹 挡 ， 由 于 很 多 大 豆 叶 片 生长 于 
同一 位 置 ， 所 以 在 田间 采集 的 大 豆 叶 片 经 常会 被 不 同 
的 叶片 所 遮挡 。 

(3) 背景 噪声 影响 大 : 直接 将 卷 积 神经 网 络 用 于 
不 同 植物 叶片 分 类 识别 的 处 理 方法 虽然 被 广泛 应 用 ， 
但 由 于 背景 复杂 ， 可 能 分 类 结果 受 背景 噪声 影响 较 大 ， 
只 对 单一 数据 集 有 效 ， 不 具备 泛 化 能 力 。 

针对 这 些 困 难 ， 本 文 利用 图 像 处 理 技 术 对 采集 的 


叶片 图 像 数据 ， 可 以 提高 
豆 叶片 形态 识别 


叶片 形态 的 分 类 与 特 


(a) 披 针 形 (b) 卵 圆 形 


(oc) 椭圆 形 (d) 圆 形 


图 1 大 豆 叶 片 的 4 种 形态 


Fig.1 Four forms ofsoybean leaves 
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大 豆 叶 片 进行 感 兴趣 区 域 划 分 ， 叶 片 提 取 和 标准 化 等 
处 理 ， 从 而 避免 图 像 非 线 性 失真 ， 目 标 被 遮挡 和 背景 
噪声 等 问题 的 影响 ,使 训练 的 卷 积 神经 网 络 具 有 更 强 
的 泛 化 能 
2.1.2 图 像 采集 

本 文 所 使 用 的 数据 来 自 黑龙 江 省 农业 科学 院 大 豆 
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陆 丽 娜 ， 于 啸 
深度 学 习 在 大 豆 叶 片 图 像 数据 管理 中 的 识别 与 分 类 研究 


数据 准备 


二 值 化 


Y 


图 像 感 兴趣 区 域 划 
分 


轮廓 查找 


= T RY 
形态 学 变 大 豆 叶 片 提取 


满 水 填充 


试验 田中 的 大 豆 植 株 ， 在 大 豆 盛 花期 ， 随 机 对 来 自 不 
同 大 豆 品 种 的 植株 中 上 部 发 育成 熟 的 三 出 复 叶 进行 
采摘 ， 以 减少 识别 过 程 中 不 同 品 种 之 间 大 豆 叶 片 形态 
的 潜在 差异 ， 增 加 对 不 同 种 类 大 豆 叶 片 形 态 识别 的 准 
确 性 。 

将 采摘 好 的 3 200 组 大 豆 叶片 依次 放置 在 封闭 的 暗 
箱 中 进行 图 像 采集 。 然 后 利用 基于 标记 的 分 水 岭 分 割 
方法 对 采集 好 的 大 豆 叶 片 图 像 进行 分 割 ， 每 张 分 割 好 
的 大 豆 叶片 图 像 包 括 三 出 复 叶 ， 利 用 基于 标记 的 分 水 
岭 分 割 中 创建 的 叶片 掩 模 ， 使 其 只 显示 三 出 复 叶 中 的 
顶 小 叶 ， 将 背景 与 其 余 叶 片 利用 掩 模 覆盖 变 为 黑色 ， 
最 终 得 到 3 200 张 单个 大 豆 叶片 图 像 。 共 分 为 4 种 类 
型 : 披 针 形 ， 卵 圆 形 ， 椭 圆 形 和 圆 形 。 其 中 训练 集 与 
测试 集 按 7 : 3 的 比例 划分 ， 即 2240 张 作 为 训练 图 片 ， 
960 张 作 为 测试 图 片 。 另 外 单独 对 训练 集 做 数据 增强 ， 
将 训练 集中 的 图 像 进行 翻转 和 随机 旋转 ， 最 终 得 到 的 
训练 集 为 15 680 张大 豆 叶片 图 像 。 


2.2 实验 方法 


本 文 利用 制作 的 暗箱 采集 装置 对 大 豆 叶片 进行 集 
中 采集 ， 再 利用 图 像 处 理 技 术 对 大 豆 叶片 图 像 进行 感 
兴趣 区 域 划 分 ,叶片 提 取 等 处 理 ， 最 后 利用 深度 学 习 
对 大 豆 叶片 进行 分 类 识别 。 技 术 流 程 图 如 图 2 所 示 。 


个 


EN 
(b) 灰 度 化 经 过 高 斯 滤波 


m 
m 
a 
ia 
a 

BEEBE eee 

(aR 


(0) 二 值 化 图 像 
图 3 叶片 图 像 提取 过 程 


Fig.3 Leaf image extraction process 


分 水 岭 分 割 


数据 标准 化 


利用 深度 学 习 对 大 豆 
叶片 形态 进行 分 类 


对 卷 积 神经 网 络 模 
型 进行 测试 及 校正 


图 2 技术 流程 图 


Fig.2 Technical flow chart 


图 像 感 兴趣 区 域 划分 

OpenCV 是 由 英特尔 公司 开发 的 ， 目 前 最 常用 的 跨 
平台 的 计算 机 视觉 库 ， 可 用 于 开发 实时 的 图 像 处 理 、 
计算 机 视觉 以 及 模式 识别 程序 。 因 此 本 文 利用 OpenCV 
开源 计算 机 视觉 库 对 图 像 进行 批量 提取 处 理 ， 对 采集 
好 的 大 豆 叶 片 图 像 ， 进 行 灰 度 化 处 理 以 及 高 斯 滤波 处 
理 ， 用 以 去 除 图 像 的 噪声 。 然 后 进行 二 值 化 处 理 ， 得 
到 二 值 图 。 最 后 利用 轮廓 检测 ， 找 到 图 像 的 最 小 外 界 
四 边 形 。 根 据 最 小 外 接 四 边 形 的 4 个 顶点 划分 RO 感 
兴趣 区 域 ， 去 除 暗箱 中 的 背景 对 叶片 分 割 的 影响 ,得 
到 提取 好 的 叶片 (图 3)。 
2.2.2 ”叶片 提取 

利用 基于 标记 的 分 水 岭 分 割 算法 对 大 豆 叶 片 图 像 
进行 提取 ， 基 于 标记 的 分 水 岭 分 割 算 法 是 在 传统 的 分 
水 岭 分 割 算法 的 基础 上 ， 利 用 形态 学 变换 确定 要 处 理 


2.2.1 


(d) 轮 廓 最 小 外 接 四 边 形 


ORI ENR 
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的 图 像 的 前 景 和 背景 区 域 。 

首先 将 已 经 划分 好 感 兴趣 区 域 的 大 豆 叶 片 图 像 看 
成 拓扑 平面 ， 图 像 中 每 一 点 像素 的 灰 度 值 表示 该 点 的 
海拔 高 度 ， 灰 度 值 高 的 区 域 可 以 被 看 成 是 山峰 ， 灰 度 
值 低 的 区 域 可 以 被 看 成 是 盆地 。 利 用 形态 学 变换 中 的 


2.3 特征 提取 与 识别 


本 文采 用 Densenet 网 络 模型 进行 大 豆 叶片 的 深层 
特征 提取 与 形态 识别 ，DenseNet 网 络 模型 的 特点 是 在 
保证 网 络 中 层 与 层 之 间 最 大 程度 的 信息 传输 的 前 提 下 ， 


开 运 算 去 除 掉 大 豆 叶片 的 根茎 部 分 ， 通 过 腐蚀 确定 要 
处 理 的 图 像 的 前 景区 域 ， 膨 胀 确定 图 像 背 景区 域 ， 进 
而 对 各 个 前 景 和 背景 区 域 依 次 进行 标记 ， 并 在 每 个 标 


直接 将 所 有 层 连 接 起 来 ， 使 网 络 的 每 一 层 都 可 以 直接 
利用 损失 函数 的 梯度 和 最 开始 的 输入 信息 ， 从 而 解决 
梯度 消失 现象 ， 训 练 更 深层 的 网 络 。 简 单 讲 ， 就 是 为 


记 下 灌 入 不 同 颜 色 的 水 ， 随 着 水 位 的 升 高 ， 水 通过 流 
动 将 逐渐 填充 满 所 有 空 岔 地， 而 来 自 不 同 的 标记 下 的 
不 同 颜色 的 水 将 被 水 坝 隔 开 。 使 其 已 经 确定 的 各 个 前 
景 和 背景 区 域 分 别 成 为 一 个 整体 ， 从 而 根据 被 水 坝 隔 
离 的 各 个 盆地 的 不 同 标记 ， 将 完整 的 大 豆 叶片 分 成 3 
个 单个 的 大 豆 叶 片 ， 并 将 大 豆 叶 片 三 出 复 叶 中 的 顶 小 
叶 单 独 显 示 出 来 ， 其 他 叶片 同 背景 一 起 使 用 捧 模 覆盖 
掉 。 从 而 避免 因 传统 分 水 岭 分 割 算 法 对 图 像 灰 度 值 的 
细微 变化 而 产生 的 过 度 分 割 (图 4)。 


(a) 分 割 好 的 完整 大 豆 叶片 
图 4 图 像 分 割 


Fig.4 Image segmentation 


(b) 分 割 好 的 大 豆 三 出 复 叶 顶 小 叶 


最 后 ， 利 用 OpenCV 对 分 割 好 的 大 豆 叶 片 图 像 进 
行 轮廓 检测 ， 将 检测 到 的 轮廓 边缘 进行 循环 遍历 ， 根 
据 坐标 筛选 出 轮廓 边缘 中 最 上 ， 最 下 ， 最 左 ， 最 右 点 
的 坐标 ， 分 别 向 四 周 增加 200 像素 值 ， 最 后 以 上 下 长 
度 和 左右 长 度 中 的 最 大 值 作为 标准 化 后 的 图 像 长 度 和 
宽度 ， 裁 前 成 正方 形 ， 并 统一 改 为 224x224 大 小 像素 


了 保证 能 够 获得 网 络 层 之 间 的 最 大 信息 ， 将 所 有 层 进 
行 互相 连接 ， 每 一 层 的 输入 来 自前 面 所 有 层 的 输出 ， 
如 图 5 所 示 。 尽 可 能 地 对 特征 进行 极致 利用 ， 从 而 达 
到 更 少 的 参数 ， 就 可 以 训练 更 深 、 更 准确 、 更 有 效 的 
卷 积 网 络 的 效果 。 


图 5 DenseNet 网 络 特征 传递 连接 图 


Fig.5 DenseNet network feature transfer connection diagram 


2.3.1 网 络 模型 结构 

DenseNet 网 络 模 型 结构 主要 由 4 个 Dense Block 组 
成 ， 每 个 Dense Block 中 ,分别 包含 6 个 、12 个 、64 
个 、48 个 Bottleneck 层 ， 其 中 每 个 Bottleneck 层 都 具 
有 相同 的 层 结构 ， 即 BN-ReLU-Conv(1x1)-BN-ReLU- 
Conv(3x3)， 它 可 以 使 各 个 Dense Block 内 的 特征 的 尺 
才 统 一 ， 避 免 连接 中 出 现 尺 寸 的 问题 。 并 且 为 了 使 其 
网 络 更 窗 ， 参 数 更 少 ， 每 个 Bottleneck 层 最 后 的 输出 
特征 都 为 48 个 ， 这 也 保证 了 特征 更 有 效 的 传递 和 网 络 


的 图 像 ， 将 其 作为 标准 化 后 的 图 像 输入 深度 学 习 进 行 
训练 ， 使 其 不 受 图 像 中 前 景 位 置 的 影响 ， 提 高 训练 的 
准确 率 和 泛 化 能 
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更 容易 训练 。 
每 个 Dense Block 之 间 的 层 ， 称 为 Transition 层 ， 
主要 完成 卷 积 和 池 化 的 操作 。 其 中 ，Transition 层 由 
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BN Jz, 1x1 卷 积 层 和 2x2 平均 池 化 层 组 成 ， 目 的 是 ， 
每 个 Dense Block 结束 后 的 输出 信道 个 数 很 多 ， 为 了 简 
化 模型 ， 需 要 用 1x1 的 卷 积 核 来 降 维 ， 减 小 特征 图 的 
信道 数量 (图 6)。 
2.3.2 网 络 训练 流程 

训练 DenseNet 对 大 豆 叶 片 形态 进行 分 类 识别 ， 首 
先 要 将 处 理 好 的 224x224 大 小 的 不 同形 态 大 豆 叶 片 输 
人 到 DenseNet 网 络 中 ， 网 络 初始 的 卷 积 层 有 96 个 卷 
耻 ， 卷 积 核 大 小 为 7x7， 步 长 为 2， 填 充 为 3， 然 后进 
A BN 层 和 卷 积 核 大 小 为 3x3， 步 长 为 2 的 最 大 池 化 
层 。 输 出 的 特征 将 会 依次 进入 4 个 Dense Block F, $ 
个 Dense Block 之 间 的 由 Transition 层 相 连接 。 经 过 4 
个 Dense Block 后 ， 最 后 进入 BN 层 ， 然 后 展开 成 
2 208 维 的 全 连接 层 ， 利 用 softmax 将 其 分 为 披 针 ， 卵 
ll, WALA) 4 类 (图 7)。 


China iva ERAT! 


Bang, Fi 
深度 学 习 在 大 豆 叶 片 图 像 数据 管理 中 的 识别 与 分 类 研究 


2.4 实验 结果 与 分 析 


2.4.1 实验 环境 

本 文 使 用 的 计算 机 为 Windows7 的 64 位 操作 系统 ， 
处 理 器 为 Intel Core i5-8400， 显 卡 为 GeForce GTX 
1070Ti， 内 存 为 8G。 使 用 Visual Studio 2015 作为 开发 
环境 和 OpenCV 开源 计算 机 视觉 库 对 采集 的 大 豆 叶 片 
图 像 进行 预 处 理 。 使 用 Pytorch 框架 ，Jupyter Notebook 
开发 环境 和 Python 语言 用 于 在 计算 机 上 训练 DenseNet 
网 络 模 型 以 及 测试 预测 结果 。 其 中 ，DenseNet 采用 
ReLU 激活 函数 ，ReLU 激活 函数 具有 收敛 速度 快 和 稀 
玻 激活 性 的 优点 上 。 

损失 函数 采用 了 Cross Entropy Loss ei, BIX 
RIMAR PRA, LRR, ERATE h AE ELSE Op 4 
越 接近 真实 分 布 。 该 函数 可 以 为 CNN 网 络 训练 提供 更 


Layers Output Size DenseNet-121 DenseNet-169 DenseNet-201 DenseNet-264 
Convolution 112 x 112 7 x 7 conv, stride 2 
Pooling 56 x 56 3 x 3 max pool, stride 2 
Dense Block ee | bed ee peed 
x6 x6 x6 
(1) 3 x 3 conv 3 x 3 conv 3 x 3 conv 3 x 3 conv 
Transition Layer 56 x 56 1 x 1 conv 
(1) 28 x 28 2 x 2 average pool, stride 2 
Dense Block 28 x 28 bead Er ed Ped Ee Eee EE 
(2) 3 x 3 conv 3 x 3 conv 3 x 3 conv 3 x 3 conv 
Transition Layer 28 x 28 1 x 1 conv 
(2) 14 x 14 2 x 2 average pool, stride 2 
Dense Block | ogee | x24 peed Bel [sac | xs 
(3) 3 x 3 conv 3 x 3 conv 3 x 3 conv 3 x 3 conv 
Transition Layer 14 x 14 1 x 1 conv 
(3) TRI 2 x 2 average pool, stride 2 
Dense Block 1 x 1 conv 1 x 1 conv 1 x 1 conv 1 x 1 conv 
(4) FRA | 330m | x16 | peed eset sm 
Classification 1x1 7 x 7 global average pool 


Layer 


1000D fully-connected, softmax 


图 6 DenseNet 网 络 模型 参数 图 


Fig.6 DenseNet network model parameter diagram 
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图 7 DenseNet 网 络 模型 结构 图 


Fig.7 DenseNet network model structure diagram 
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为 有 效 的 惩罚 目标 函数 ， 使 得 训练 模型 具有 更 好 的 泛 
化 能 力 。 

对 DenseNet 网 络 用 Momentum 优化 函数 进行 训 
练 。Momentum 优化 函数 是 依据 物理 学 的 势能 与 动能 
之 间 能 量 转 换 原 理 提 出 来 的 ， 当 Momentum 动量 越 大 
时 ， 其 转换 为 势能 的 能 量 也 就 越 大 ， 就 越 有 可 能 摆脱 
局 部 止 域 的 束缚 ， 进 入 全 局 凹 域 。Momentum 动量 主 
要 用 在 权重 更 新 的 时 候 ， 可 以 让 那些 因 学 习 率 太 大 而 
来 回 摆动 的 参数 ， 梯 度 能 前 后 抵消 ， 从 而 阻止 发 散 。 

一 般 ， 神经 网 络 在 更 新 权 值 时 ， 采用 如 下 公式 : 
w=w-Qaxdw，3 引 入 Momentum 后 ， 采 用 如 下 公式 : 


v=muxv-axdw 


w = w+v 

其 中 , v 初始 化 为 0，a 为 学 习 率 ，mw 是 设 定 的 一 
个 超 变 量 ， 本 文 设 定 为 0.9。 
2.4.2 评价 标准 

针对 大 豆 叶 片 形态 的 分 类 识别 ， 本 文 先 选用 传统 
机 器 学 习 方法 中 的 最 常用 的 支持 向 量 机 (SVM) 和 随 
机 森林 (RF) 对 大 豆 叶 片 形态 进行 识别 ， 又 在 深度 学 
习 中 选用 经 典 的 AlexNet 网 络 和 目前 最 为 流行 的 
ResNet 网 络 对 大 豆 叶 片 形态 进行 识别 。 最 后 并 将 不 同 
方法 的 识别 准确 率 与 本 文采 用 的 DenseNet 网 络 进行 对 
比分 析 。 每 种 大 豆 叶 片 形态 的 准确 率 计算 如 公式 所 示 。 


1 
0 = Ji 


其 中 ， 式 中 疡 为 1 表示 准确 识别 出 图 像 形态 种 类 ， 
否则 记 为 0，M 表示 测试 数据 的 数量 。 
2.4.3 不 同 算法 识别 结果 对 比 与 分 析 

SVM 与 RF 作为 传统 的 机 器 学 习 算 法 ， 需 要 利用 
图 像 处 理 技术 对 大 豆 叶 片 进行 特征 提取 ， 所 以 本 文 提 
取 大 豆 叶 片 图 像 的 形态 特征 ， 纹 理 特征 和 颜色 特征 共 
14 种 特征 作为 SVM 与 RF 的 输入 ， 其 结果 表明 SVM 
与 RF 对 大 豆 叶 片 形态 的 识别 准确 率 低 于 本 文 使 用 的 
DenseNet 网 络 。 

而 后 本 文 又 利用 AlexNet 网 络 和 ResNet 网 络 对 经 
过 图 像 处 理 的 分 割 好 的 大 豆 叶 片 顶 小 叶 图 像 作 为 卷 积 
神经 网 络 的 输入 ， 其 结果 表明 AlexNet 网 络 和 ResNet 
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网 络 对 大 豆 叶 片 形态 的 识别 准确 率 依然 低 于 本 文 使 用 
的 DenseNet 网 络 。 
其 中 ， 本 文 使 用 的 DenseNet 网 络 识 别 精度 结果 如 
表 1 所 示 。 表 1 结果 表明 ， 网 络 在 4 种 不 同 大 豆 叶 片 
的 形态 上 ,平均 识别 精度 为 0.94。 试 验 表明 网 络 能 
满足 实际 使 用 要 求 。 
表 1 不 同 大 豆 叶 片 形状 的 识别 精度 


Table 1 Recognition accuracy of different soybean leaf shapes 


大 豆 叶片 类 型 平均 识别 精度 
披 针 形 0.98 
卵 圆 形 0.96 
椭圆 形 0.88 
HJE 0.93 


不 同 算法 对 大 豆 叶 片 形 态 的 识别 准确 率 如 表 2 所 
示 ， 其 结果 表明 DenseNet 网 络 模型 对 于 大 豆 叶 片 形 态 
的 分 类 识别 相对 于 其 他 方法 具有 较 好 的 效果 。 
表 2 不 同 机 器 学 习 方法 对 大 豆 叶片 形状 的 识别 精度 比较 


Table 2 Comparison of the recognition accuracy of different 


machine learning methods for soybean leaf shape 


识别 准确 率 
方法 名 称 - 
披 针 WA MEO A 
SVM 0.95 0.96 0.78 0.48 0.80 
AlexNet 0.99 0.82 0.68 0.90 0.85 
ResNet 0.96 0.86 0.83 0.88 0.88 
DenseNet 0.98 0.96 0.88 0.93 0.94 


传统 的 机 器 学 习 算 法 由 于 需要 对 手动 对 大 豆 叶 片 
的 形态 ， 纹 理 ， 颜 色 等 特征 进行 提取 ， 工 作 量 大 且 特 
征 提取 困难 。 并 且 由 于 人 为 选择 特征 进行 提取 ， 受 主 
观 因 素 和 自然 环境 影响 较 大 ， 所 以 SVM 与 RF 对 大 豆 
叶片 形态 的 识别 准确 率 较 低 。 

而 AlexNet 网 络 和 ResNet 网 络 虽 然 直 接 将 图 像 作 
为 输入 ， 不 受 主观 因素 和 自然 环境 影响 ， 但 相对 于 
DenseNet 网 络 模型 ，AlexNet 网 络 由 于 使 用 Dropout 正 
则 化 随机 忽略 一 部 分 神经 元 ， 虽然 避 免 了 模型 的 过 拟 
合 ， 却 也 导致 了 一 部 分 特征 的 丢失 ， 所 以 对 于 比较 易 
于 分 类 的 披 针 形 有 较 好 的 识别 能 力 ， 而 对 于 其 他 3 种 
形态 则 表现 得 不 够 理想 。ResNet 利用 在 前 面 的 特征 层 
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与 后 面 的 特征 层 之 间 创 建 短 连接 。 解 决 了 深度 学 习 网 
络 越 深 ， 梯 度 消失 现象 越 明 显 的 问题 ， 而 DenseNet 相 
对 于 ResNet 选择 直接 将 所 有 层 连接 起 来 ， 并 通过 在 
Dense Block 的 3x3 卷 积 前 面 加 入 一 个 1x1 的 卷 积 ， 从 
而 减少 了 输入 的 特征 数量 ， 既 能 降 维 减少 计算 量 ， 又 
能 融合 各 个 通道 的 特征 ， 使 得 网 络 更 窄 ， 参 数 更 少 ， 
特征 和 梯度 的 传递 更 加 有 效 ， 网 络 更 加 容易 训练 。 


本 文 以 黑龙 江 省 农业 科学 院 大 豆 试验 田中 的 大 豆 
植株 豆 叶片 形态 为 例 ， 对 植物 的 叶片 识别 ， 疾 病 监测 
有 可 操作 性 ， 有 具有 一 定 的 推广 作用 ， 系 统 地 阐述 了 利 
用 深度 学 习 对 农业 数据 进行 分 类 识别 的 全 过 程 ， 通 过 
分 析 大 豆 叶片 形态 图 像 特 点 后 ， 基 于 深度 学 习 开 展 了 
对 大 豆 叶 片 形 态 的 分 类 识别 研究 ， 我 们 已 经 看 到 ， 深 
度 学 习 技术 已 经 取代 了 使 用 手工 特征 训练 的 浅 层 分 类 
器 。 只 要 有 足够 的 数据 可 用 于 培训 ， 深 度 学 习 技术 就 
能 高 度 准确 地 识别 大 豆 叶 片 。 采 用 了 DenseNet 模型 ， 
它 适 合用 于 普通 网 络 的 模型 ， 该 模型 的 优点 是 具有 最 
佳 的 性 能 和 最 少 的 存储 要 求 ， 但 缺点 是 培训 时 间 比 较 
长 ， 达 到 了 较 高 的 识别 准确 率 94% ， 并 与 其 他 图 像 识 
别 方法 进行 对 比分 析 ， 成 功 解决 了 传统 方法 在 处 理 大 
豆 叶 片 图 像 分 类 问题 上 耗 时 时 间 长 ， 效 率 低 下 ， 且 识 
别 准确 率 不 高 等 问题 。 可 以 满足 农业 图 像 数据 分 类 的 
实际 需要 。 未 来 的 研究 工作 应 努力 收集 范围 广泛 的 大 
型 日 多 样 化 的 数据 集 发 行 以 促进 大 豆 叶 片 的 识别 研究 ， 
应 侧重 于 开发 可 靠 的 背景 去 除 技术 以 及 合并 其 他 形式 
的 数据 ， 提 高 大 豆 识别 系统 的 准确 性 和 可 靠 性 。 
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Image Data Management 
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Abstract: [Purpose/Significance] We used to process soybean leaf data by looking at them and process data manually, but this method is 
very inefficient. In order to improve the classification accuracy and efficiency of soybean leaf images, further for storage and manage- 
ment of these images, we used the deep learning technique to make an in-depth study of text data and image data of soybean leaves for 
the image recognition and classification. The application of deep learning in agricultural data management mainly focuses on the image 
recognition and classification of plants and plant phenotypes in large-scale data, detection and classification of agricultural diseases and 
pests, detection and classification of crops and weeds, and prediction of crop yield. Through case analysis, our sample data demonstrated 
the application process of deep learning technology. [Method/Process] This paper systematically described the whole process of classifi- 
cation and recognition of agricultural data by using the deep learning technique. Through recognition and disease monitoring of plant 
leaves, the leaf morphology of soybean plants in the soybean experimental field of Heilongjiang Academy of Agricultural Sciences was 
taken as an example. We analyzed the image features of soybean leaf morphology, and carried out the classification and recognition re- 
search of soybean leaf morphology based on deep learning. Deep learning techniques have replaced shallow classifiers that use manual 
feature training and can identify soybean leaves with a high degree of accuracy as long as sufficient data are available for training. We 
adopted DenseNet model, which is suitable for common network model. The advantages of this model are that it has the best perfor- 
mance and the least storage requirements. First, we selected support vector machine (SVM) and random forest (RF) in traditional ma- 
chine learning methods to identify soybean leaf morphology. Second, AlexNet and ResNet were selected to identify soybean leaf mor- 
phology. Finally, the recognition accuracy of different methods were compared with the DenseNet network adopted in this paper. [Re- 
sults/Conclusions] Through the training of DenseNet model, the recognition accuracy of 94% was achieved, which successfully solved 
the problems of long time, low efficiency and low recognition accuracy of traditional methods in processing image classification of soy- 
bean leaves, and could meet the actual needs of agricultural image data classification. Future research efforts will strive to collect a wide 
range of large and diverse data sets to facilitate soybean leaf recognition, and focus on developing reliable background removal tech- 
niques and incorporating other forms of data to improve the accuracy and reliability of soybean leaf recognition systems. 


Keywords: deep learning; agricultural science data; data classification; image recognition 
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